小寺・西田の「金曜ランチビュッフェ」より

テープ起こしの悩みを解決できるか? カシオのアプリ「キーワード頭出し ボイスレコーダー」を試す

今回は、別途機材を用意する時間もなかったので、iPhone 6 Plusにアプリを入れ、内蔵マイクで録音するという、もっともシンプルな(そして、多くの人が行なうであろう)方法で使った。インタビューは、対象一人に質問者として自分が一人。双方の間にiPhoneを置き、相手にマイクを向けて録音した。といっても、まったく真ん中というわけではなく、筆者の方により近かった。この条件が、のちのち大きく効いてくる。取材場所は普通のオフィスだが、オープンスペースだったので、周囲の環境音も入っている。要は「そこそこ条件が悪いが、特別な環境ではない」状態だ。

「キーワード頭出し ボイスレコーダー」では、録音品質を複数の候補から選べるが、今回はデフォルト(もっとも品質が低く、データ量が小さくなる条件)にしている。具体的には、コーデックはADPCMで、周波数は16000Hz。最高品質の場合、リニアPCMかつ周波数48000Hzで記録できるが、あえて「普通の設定でどのくらいいけるか」を試す意図があった。

このアプリでは、録音時に、同時に声から「音」の情報を分析するようだ。テキストにしてしまうわけではないが、「どんな音の言葉を話しているか」を最終的に検索するための元になるデータをここで作っているようだ。

そして、実際に検索するには、できたデータを後処理する必要がある。「アプリ用データの作成」と表現されているが、これにはかなりの時間がかかる。アプリはバックグラウンド動作にしていいが、スリープさせると作業は止まる。だいたい録音時間の半分程度、との話だったが、筆者の場合、80分のインタビューのデータ化に50分程度かかった。

・「アプリ用データの作成」を警告する画面。時間がかかること、消費電力が多いことなどがわかる。

http://dl.dropbox.com/u/75917465/kn028/casio03.png

では、成果がどうかというと……。これはなかなか優秀だ。検索した部分を再生すると、たしかに、検索に使ったキーワードが出てくる。録音全体を聞いていないので、「検索に引っかからなかったワード」がどのくらいあったか、確実にわかっているわけではない。しかし、手元にあるメモと照合すると、そんなにずれてはいないようだ。

・検索してみると、音から「目的のキーワードを話している部分」がかなり的確に抽出される

もちろん、問題点もある。

まず第一に、検索対象は「かな」だ。同音異義語は同じものとしてピックアップされる。要は、このアプリは「音を抽出している」ものであって、意味を抽出しているわけでも、文章を作っているわけでもない、ということだ。

また、やってみると、想定よりもたくさんの検索結果が出てくる。理由は、こちらの質問に含まれるキーワードに、より多くヒットしていたからだった。その辺は、筆者が特に声がデカい……ということもあるだろうが、より関与度が高かったのは、マイクの場所が筆者に近く、インタビュイーの声よりも大きく拾われたからでは、と予想している。

このアプリは複数話者で認識を分けることはしていない。だから、大きい音でキーワードに近い言葉があれば、それをピックアップしてしまうわけだ。ライターが「テープ起こしをしたい」という場合、自分の質問でなく相手の答えを検索したいと思うものだが、話者を特定しないこのアプリの場合、こういう問題が起きる。

だからこのアプリは使えない……というつもりはまったくない。要は、相手の声がより大きく入るようにすればいい、ということなのだから。

またそもそも、本アプリは「テープ起こし」用ではない。講義などをメモしながら聴講した時、後でメモを見つつ「なんと言ったか確認したい」というニーズを満たすものだ。企業研修や大学の講義など、静かに聞いたものをメモする用途だと、この仕様でまったく問題ないだろう。

筆者のファーストインプレッションでいえば、これはなかなかのものだ。話者が少ないインタビューでは、けっこう有用なのではないだろうか。おそらく、会見メモでも価値が出そうだ。問題は、バッテリーと時間が潤沢な時でないと、インデックス作成が厳しいことだろうか。だが、致命的なものとはいえない。

筆者以外にもアプリを試した人はいて、「うまくいかない」という事例も聞いている。どうも理由が判然としないので、評価を定めにくい。

しかし、ボイスレコーダーのような、枯れたアプリに新しい、しかも理想的な競争軸を持ち込んだ、というあたりは、とても好ましい。どんどん完成度を上げていってほしい。

そして、願わくばAndroid用も。バックグラウンドで処理しやすいので、iOSより向いているのでは、と思うのだ。

小寺・西田の「金曜ランチビュッフェ

2015年3月17日 Vol.028 <損得のパワーバランス号>目次
今週の目次

01 論壇(小寺)
TPP知財条項に反対する、それぞれの理由
02 余談(西田)
テープ起こしの悩みを解決できるか? カシオの「キーワード頭出し ボイス
レコーダー」を試す
03 対談(西田)
鷹野凌氏に聞く「日本独立作家同盟が生まれた理由」(1)
04 過去記事アーカイブズ(小寺)
未曾有の大惨事に立ち向かう日本企業
05 ニュースクリップ(小寺・西田)
06 今週のおたより(小寺・西田)

12コラムニスト小寺信良と、ジャーナリスト西田宗千佳がお送りする、業界俯瞰型メールマガジン。 家電、ガジェット、通信、放送、映像、オーディオ、IT教育など、2人が興味関心のおもむくまま縦横無尽に駆け巡り、「普通そんなこと知らないよね」という情報をお届けします。毎週金曜日12時丁度にお届け。1週ごとにメインパーソナリティを交代。

 

ご購読・詳細はこちらから!

 

筆者:西田宗千佳

フリージャーナリスト。1971年福井県出身。得意ジャンルは、パソコン・デジタルAV・家電、そしてネットワーク関連など「電気かデータが流れるもの全般」。取材・解説記事を中心に、主要新聞・ウェブ媒体などに寄稿する他、年数冊のペースで書籍も執筆。テレビ番組の監修なども手がける。

 

1 2

その他の記事

統計学は万能ではない–ユングが抱えた<臨床医>としての葛藤(鏡リュウジ)
ゲームを通じて知る「本当の自分」(山中教子)
ネットとは「ジェットコースター」のようなものである(小寺信良)
「実現可能な対案」としての『東京2020 オルタナティブ・オリンピック・プロジェクト』(宇野常寛)
都知事・小池百合子さんは希望の党敗戦と台風対応の不始末でどう責任を取るのか(やまもといちろう)
「昔ながらのタクシー」を避けて快適な旅を実現するためのコツ(高城剛)
NFCでデータ転送、パナソニックの血圧計「EW-BW53」(小寺信良)
私的録音録画の新しい議論(小寺信良)
なぜ人を殺してはいけないのか(夜間飛行編集部)
新興国におけるエンジンは中国(高城剛)
映像製作とカンナビス・ビジネスが熱いロサンゼルス(高城剛)
「自信が持てない」あなたへの「行」のススメ(名越康文)
隣は「どうやって文字入力する」人ぞ(西田宗千佳)
寒暖差疲労対策で心身ともに冬に備える(高城剛)
主役のいない世界ーーCESの変遷が示すこと(本田雅一)

ページのトップへ